期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于全息图平稳分布因子的离群点检测算法
张忠平, 郭鑫, 张玉停, 张睿博
《计算机应用》唯一官方网站    2023, 43 (6): 1705-1712.   DOI: 10.11772/j.issn.1001-9081.2022060930
摘要175)   HTML10)    PDF (3993KB)(117)    收藏

使用传统的基于图的方法进行离群点检测构造转移概率矩阵需要使用数据的整体分布,容易忽略数据的局部信息,导致检测精度低,而使用数据的局部信息可能导致“悬空链接”的问题。针对这些问题,提出一个基于全息图平稳分布因子的离群点检测算法(HSDFOD)。首先,使用相似度矩阵自适应地获取每个数据点的邻居集合构造一个局部信息图;然后,引入最小生成树构造一个全局信息图;最后,利用局部信息图和全局信息图融合为一个全息图构造转移概率矩阵进行马尔可夫随机游走,并通过生成的平稳分布检测离群点。在人工数据集A1~A4上,HSDFOD的精确率均高于SOD(Outlier Detection in axis-parallel Subspaces of high dimensional data)、SUOD(accelerating large-Scale Unsupervised heterogeneous Outlier Detection)、IForest (Isolation Forest)和HBOS (Histogram-Based Outlier Score);曲线下面积(AUC)整体上也优于这4个对比算法。在真实数据集上,HSDFOD的精确率均高于80%,AUC均高于SOD、SUOD、IForest和HBOS。可见,所提算法在离群点检测上有较好的应用前景。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 动态融合社交信息的社会化推荐
任柯舟, 彭甫镕, 郭鑫, 王喆, 张晓静
计算机应用    2021, 41 (10): 2806-2812.   DOI: 10.11772/j.issn.1001-9081.2020111892
摘要350)      PDF (728KB)(401)    收藏
针对推荐算法中的数据稀疏问题,通常引入社交数据作为辅助信息进行社会化推荐。传统的社会化推荐算法忽略用户的兴趣迁移,导致模型无法描述用户兴趣的动态变化特征,也忽略了社交影响的动态特性,导致模型将很久以前的社交行为与近期社交行为同等对待。针对这两点提出一种社交信息动态融合的社会化推荐模型SLSRec。首先,利用自注意力机制构建用户交互物品的序列模型,以实现对用户兴趣的动态描述;然后,设计具有时间遗忘的注意力机制对社交短期兴趣进行建模,并设计具有协同特性的注意力机制对社交长期兴趣进行建模;最后,融合社交的长短期兴趣与用户的短期兴趣来获得用户的最终兴趣并产生下一项推荐。利用归一化折损累计增益(NDCG)和命中率(HR)指标在稀疏数据集brightkite和稠密数据集Last.FM上把所提模型与序列推荐模型(自注意力序列推荐(SASRec)模型)和社会化推荐模型(社会推荐的神经影响扩散(DiffNet)模型)进行对比验证。实验结果显示,SLSRec模型与DiffNet模型相比,在稀疏数据集上的HR指标提升了8.5%;与SASRec模型相比,在稠密数据集上的NDCG指标提升了2.1%,表明考虑社交信息的动态特性使推荐结果更加准确。
参考文献 | 相关文章 | 多维度评价
3. 基于特征本体的文本流主题演化
陈千, 桂志国, 郭鑫, 向阳
计算机应用    2015, 35 (2): 456-460.   DOI: 10.11772/j.issn.1001-9081.2015.02.0456
摘要515)      PDF (886KB)(379)    收藏

针对网络大数据时代文本流的主题演化研究大多基于经典概率主题模型,以词袋假设为前提导致主题的语义缺失问题和批处理问题,提出一种在线增量的基于特征本体的主题演化算法。首先,基于词共现和通用本体库WordNet构建特征本体,用特征本体对文本流主题进行建模;其次,提出一种文本流主题矩阵构建算法,实现在线增量主题演化分析;最后,依据该矩阵提出文本流主题本体演化图构建算法,利用特征本体的子图相似度计算主题相似度,从而获得文本流中主题随时间的演化模式。在科技文献上的实验上,满意度同传统在线潜在狄利克雷分配模型(LDA)不相上下,但时间复杂度降低到O(nK+N)。所提出的方法引入了本体,加入了语义关系标注,可图形化展现主题的语义特征,并在此基础上在线增量地实现了主题演化图的构建,在语义解释性和主题可视化方面更具有优势。

参考文献 | 相关文章 | 多维度评价
4. 离散自由搜索算法
郭鑫 孙丽杰 李光明 江开忠
计算机应用    2013, 33 (06): 1563-1570.   DOI: 10.3724/SP.J.1087.2013.01563
摘要640)      PDF (572KB)(668)    收藏
针对离散组合优化问题,给出一个自由搜索的算法。但是仅仅通过自由搜索算法求得的解,往往存在交叉现象,针对这个问题提出将离散自由搜索算法和交叉消除相结合的算法,这样不仅大大地提高了自由搜索算法运算过程的收敛速度,而且较大程度地提升了结果的质量。利用旅行商问题(TSP)标准库中的测试数据对所提算法进行了验证,结果表明该算法比遗传算法性能提高了约1.6%。
参考文献 | 相关文章 | 多维度评价
5. 最小闭树特征集的聚类与分类方法
郭鑫 李云 黄云 周清平
计算机应用    2010, 30 (2): 423-426.  
摘要1565)      PDF (806KB)(1089)    收藏
提出一种基于最小闭树特征集的聚类与分类方法,有效地解决了在实际应用中因数据量大而无法聚类与分类的问题。其基本思想为:以最小闭树特征集作为候选聚类与分类特征,采用动态阈值按相似度聚类,使得树聚类快速而精确;提出树分类规则等级概念,并应用于树分类方法中,能迅速预测未知的树结构。实验结果表明,在树节点数较多或数据量大时,新方法有效可行,且与类其他方法相比效率有显著提高。
相关文章 | 多维度评价
6. 一种新的频繁子树增量式更新方法
郭鑫 黄云 颜一鸣 周清平
计算机应用    2010, 30 (05): 1300-1303.  
摘要231)      PDF (647KB)(996)    收藏
讨论频繁子树增量式更新问题,提出一种新的频繁子树增量式更新算法。提出有效树集概念和增量式更新策略,在更新挖掘时,无须重新运行子树挖掘程序,能充分利用已有的挖掘结果,算法只需要进行一次数据库遍历操作。提出候选子树剪枝策略,在更新挖掘过程中,能大幅减少子树同构次数,有效地提高了算法的运行效率。通过大量实验分析表明,算法有效可行且具有较高的运行效率。
相关文章 | 多维度评价